第 10 卷 第 2 期 信息 技术 快报 Vol.10 No.2 
Information Technology Letter Mar. 2012 


片上 多 核 处 理 器 验证 综述 


沈 海 华 


摘要 : 片上 多 核 处 理 器 是 当今 主流 处 理 器 结构 ， 也 是 最 复杂 最 难 验 证 的 一 类 集成 电路 芯片 。 本 文 梳理 了 集 
成 电路 验证 领域 现 有 的 技术 和 工具 ， 结 合 国内 外 片上 多 核 处 理 器 验证 的 实例 ， 分 析 了 现 有 验证 技术 和 工具 
看 对 片上 多 核 处 理 器 验证 的 适用 性 和 局 限 性 ， 并 针对 现存 问题 进行 了 初步 探讨 。 
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1 引言 
1.1 验证 危机 


纵 观 集成 电路 工艺 发 展 历史 , 自 上 世纪 90 年 代 中 的 0.25 微米 开始 , 历经 0.18 微米 (1999 
年 )、0.13 微米 (2001 年 )、90 APK (2003 年 )、65 纳米 、45 纳米 、28 纳米 、22 纳米 工艺 
(2009 年 ， 英 特 尔 )， 半 导体 工业 突破 了 一 个 又 一 个 看 似 不 可 能 跨越 的 瓶颈 ， 神 奇 地 继续 遵循 
着 摩尔 定律 高 速 发 展 。 半 导体 技术 的 发 展 使 电子 产品 设计 越 来 越 复杂 ,相应 地 设计 中 出 现 错 
误 的 风险 也 越 来 越 高 。 为 了 保证 设计 的 正确 性 , 理想 情况 是 通过 各 种 验证 技术 手段 遍历 待 验 
证 设计 (Design under Verification, DUV) 的 全 部 状态 空间 。 然 而 ， 当 前 集成 电路 规模 普遍 在 
ed 千 万 门 以 上 , 包含 上 亿 晶 体 管 的 设计 已 不 再 罕见 ， 遍 历 全 部 待 验 证 设计 状态 空间 已 成 为 “不 
c 可 能 完成 的 任务 ”如 何 用 有 限 的 技术 手段 ， 在 有 限 的 时 间 内 验证 几乎 膨胀 到 “无 限 ”的 待 
验证 设计 状态 空间 成 了 摆 在 所 有 集成 电路 从 业者 面前 最 困难 的 问题 。 十 几 年 来 , 验证 领域 科 
研 人 员 和 工程 师 开 展 了 大 量 的 研究 ， 在 模拟 仿真 、 形 式 化 方法 、 仿 真 加 速 、 状 态 空间 裁减 、 
状态 空间 覆盖 度量 等 方面 取得 了 一 系列 研究 成 果 。 尽 管 如 此 , 面 对 复 杂 集成 电路 设计 带 来 的 
© 越 来 越 严 重 的 “状态 空间 爆炸 ”， 现 有 技术 手段 仍 显 得 捉襟见肘 。 早 在 2003 年 ， 国 际 半 导体 
= 技术 路 线 图 的 作者 就 深 有 感触 地 称 验证 已 经 “由 瓶颈 转化 成 了 和 危机” 到 了 今天 ， 集 成 电路 
芯片 首次 流 片 成 功率 《此 处 指 首次 流 片 错误 率 达 到 可 用 水 平 ) 已 越 来 越 低 ,“ 验 证 危机 ”成 
为 业内 共同 担忧 的 问题 。 面 对 现实 ， 即 使 英特尔 、IBM、AMD、 英 伟 达 (NVIDIA) 等 国际 
知名 芯片 厂商 也 不 得 不 正视 首次 流 片 错误 率 问 题 , 而 硅 后 验证 更 成 为 近 两 年 验证 领域 研究 的 
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纵 观 集成 电路 验证 技术 的 发 展 历史 ， 如 果 说 在 上 世纪 90 年 代 验 证 还 只 是 各 种 设计 工程 
VEY “GEER” TCE, WAE 20 年 后 的 今天 ， 验 证 已 经 成 为 集成 电路 设计 流程 中 不 折 不 扣 的 
“Has” A “SEAL”, 是 集成 电路 厂商 、 电 子 设计 自动 化 (EDA) 工具 三 商 及 学 术 界 高 度 重 
视 的 重点 研究 领域 。 本 文 重点 关注 当今 最 复杂 的 一 类 集成 电路 一 片上 多 核 处 理 器 〈Chip 
Multi-Processor; CMP) 的 验证 。 


1.2 片上 多 核 处 理 器 的 发 展 及 其 对 “验证 危机 ”的 影响 


片上 多 核 处 理 器 是 在 单个 芯片 上 设置 多 个 处 理 器 核 构 成 的 多 处 理 器 系统 , 应 用 程序 的 多 
个 线程 可 以 在 多 个 处 理 器 核 上 同时 执行 中 24。 在 过 去 的 10 年 中 , 片上 多 核 处 理 器 实现 了 从 体 
系 结构 实验 室 的 宠儿 到 商业 化 处 理 器 的 跨越 。 今 天 ， 处 理 器 设计 已 全 面 步 入 片上 多 核 处 理 器 
时 代 。 
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传统 的 硅 前 验证 方法 包括 模拟 仿真 方法 、 形 。 表 1.， 不 同 层 次 验证 方法 大 臻 速度 对 比 
式 化 方法 和 硬件 仿真 加 速 验证 方法 。 情况 四 
AMUN TER SES Ae 
最 多 ， 最 常用 的 方法 。 与 其 它 类 型 的 设计 相 比 ，。 RACE zio 
片上 多 核 处 理 器 在 模块 级 模拟 仿真 应 用 上 差别 不 RIL 级 模拟 仿真 10 to 10 
大 ， 只 是 相 比 普通 超标 量 处 理 器 模块 规模 更 大 一 。 门 级 网 表 模 拟 仿真 10 1010 
些 单 模块 最 大 规模 可 以 是 一 个 通用 处 理 器 核 )。 EME “10， 
模拟 仿真 方法 在 片上 多 核 处 理 器 验证 中 的 主要 应 ”EPEGA 民 于 0 
用 问题 出 在 系统 级 模拟 仿真 上 。 虽 然 模拟 仿真 方 。 王 所 验证 


法 可 以 处 理 较 大 规模 的 设计 ， 但 速度 并 不 理想 。 表 1 中 列 出 了 ARM 的 验证 工程 师 统 计 的 不 
同 层次 的 软件 模拟 仿真 、 硬 件 仿真 加 速 及 硅 后 验证 大 致 速度 对 比 情况 。 可 以 看 出 ， 模 拟 仿真 
与 硬件 加 速 仿真 /现场 可 编程 门 阵列 / 硅 后 验证 相 比 ， 速 度 慢 了 多 个 数量 级 。 面 对 设计 规模 不 
大 的 情况 〈 如 普通 的 单 核 处 理 器 设计 )， 可 以 通过 投入 更 多 的 运算 仿真 资源 ， 采 用 超大 规模 
服务 器 农场 来 缓解 模拟 仿真 方法 的 速度 问题 。 例 如 英特尔 为 验证 奔 4 用 了 6000 台 机 器 ，24 
小 时 不 间断 地 运行 了 两 年 ， 所 运行 的 总 指令 数 也 不 过 相当 真正 的 奔 4 芯片 运行 两 分 钟 的 数 
TRU, 然而， 对 于 片上 多 核 处 理 器 来 说 ， 随 着 设计 规模 和 复杂 度 的 增长 ， 模 拟 仿 真 速度 会 进 
一 步 下 降 。 在 现 有 技术 工具 条 件 下 ， 当 竺 验证 设计 的 规模 和 复杂 度 大 到 一 定 的 程度 ,模拟 仿 
真 速度 将 会 变 得 难以 容忍 。 


目前 常用 的 解决 方法 有 两 种 : 一 是 提高 仿真 器 速度 ,这 是 许多 电子 设计 自动 化 工具 供应 
商 不 懈 努 力 的 目标 ，Synopsys 就 多 次 宣称 要 保证 其 旗下 的 仿真 软件 VCS 的 模拟 速度 每 两 年 
都 要 有 两 倍 至 三 倍 的 提升 ; 二 是 增加 仿真 验证 平台 的 规模 和 并 行 度 , 即 采 用 更 多 的 工作 站 和 
服务 器 ,提高 仿真 过 程 的 并 行 度 ， 从 而 使 得 单位 时 间 可 以 仿真 的 节拍 (cycles) 数 增加 。2008 
年 以 来 , 面 对 传 统 模拟 验证 由 于 速度 问题 无 法 处 理 超大 规模 集成 电路 设计 的 尴 众 局 面 ， 已 有 
多 家 电子 设计 自动 化 工具 供应 商 进行 了 提高 并 行 度 的 各 种 方法 的 尝试 。 遗憾 的 是 , 到 目前 为 
IE, 投入 的 资源 与 获得 的 加 速 比 相 比 ， 效 果 并 不 相称 。 昌 有 厂商 宣称 可 提高 模拟 速度 至 单线 
程 产品 的 4-5 倍 ， 从 本 文 作者 自身 体验 来 看 ， 对 于 真正 的 大 规模 设计 ， 基 本 加 速 比 为 1.5 7c 
Fi, 理论 极限 加 速 比 难以 达到 。 在 电子 设计 自动 化 工具 支持 有 限 的 情况 下 验证 技术 人 员 和 希望 
找 出 一 种 可 行 的 方法 来 解决 该 问题 , 以 便 支持 片上 多 核 处 理 器 等 超大 规模 集成 电路 设计 的 模 
拟 仿真 ， 特别 是 系统 级 模拟 仿真 。 在 龙芯 验 证 实践 中 , 我们 采用 了 层次 化 的 模拟 仿真 验证 方 
法 来 解决 该 问题 , 即 把 待 验 证 设计 逐 级 划分 为 更 小 的 单元 甚至 模块 , 为 各 模块 建立 简单 的 参 
考 模 型 ， 通 过 待 验证 设计 与 参考 模型 的 自由 变化 、 交 叉 、 组 合 ， 既 可 以 有 效 提 高 系统 级 模拟 
仿真 的 速度 ， 又 可 以 不 断 变 化 验证 重点 部 位 ， 最 终 实 现 全 系统 的 模拟 仿真 。 


履 盖 率 是 评估 仿真 验证 效果 的 重要 指标 , 通过 履 盖 率 分 析 可 以 指示 验证 的 空白 点 ,并 指 
导 此 后 的 验证 。 仿 真 验证 的 过 程 从 某 种 程度 上 来 说 就 是 不 断 运行 更 多 的 测试 向 量 ， 追求 更 高 
的 覆盖 率 ， 直 到 履 盖 率 达到 100% 的 过 程 。 履 善 率 通常 包括 代码 履 盖 率 和 功能 覆盖 率 。 代 码 
履 盖 率 的 确定 依赖 设计 代码 模型 , 在 传统 模拟 仿真 方法 中 , 代码 覆盖 率 通 过 模拟 仿真 工具 就 
可 以 采集 ; 功能 覆盖 率 则 需要 验证 设计 人 员 自 己 定 义 模型 和 书写 代码 , 再 插入 待 验证 设计 的 
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模拟 仿真 过 程 以 实 


成 了 


点 和 覆盖 率 模 型 
是 片上 多 核 处 到 
的 难点 在 于 前 面 
拟 仿 真 速度 成 数量 级 
10? ~ 10^ 个 ， 大 约会 使 得 
更 复杂 的 结构 , 定义 的 覆盖 率 模型 数量 将 远 】 


个 


标量 处 理 器 ) 来 说 是 一 项 十 分 成 熟 的 技术 ， 但 对 了 
E 题 ,虽然 片上 多 核 处 理 器 的 复杂 共享 存储 和 片上 互 连 结 构 使 得 定义 新 Ef 


非常 必要 日 只 是 一 个 经 验 、 


工作 量 


巨大 ,但 这 些 也 


器 履 盖 率 评 佑 困难 的 关键 。 对 了 
提 到 过 的 模拟 仿真 速度 问题 一 一 附加 了 窗 盖 率 采 
以 功能 覆盖 率 为 例 ， 普 通 超 标量 处 理 
模拟 仿真 速度 下 降 2 个 数量 级 ， 片 上 多 核 处 悍 
池 通 超标 量 处 理 器 ,导致 本 已 难以 容忍 的 模拟 


下 降 。 


7] 


既然 基于 (软件 ) 
多 核 处 理 器 中 广泛 应 用 的 硬件 仿真 加 速 器 上 ， 
的 硬件 仿真 加 速 器 是 否 可 以 文 持 传统 的 覆盖 率 采 集 呢 ? 首先 我 们 


速 器 的 基本 工作 原理 。 基 于 硬件 模拟 引擎 的 方法 称 为 仿真 


EH 
上 加 霜 ” 
模拟 仿真 的 覆盖 率 采 集 遇 到 了 了 团 
看 起 来 


现 和 采集 和 分 析 。 履 盖 率 评估 对 于 一 般 规 模 的 集成 ! 
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功能 和 
耐心 和 工作 量 问题 ， 并 不 
F 模 拟 仿真 来 说 ,片上 多 核 处 理 器 覆盖 率 评估 


BE 路 设计 (如 普通 单 核 超 
复杂 的 片上 多 核 处 理 器 来 说 ,4 


xi 8 VEG 


Es 
Tui 


难 ， 人 们 很 
与 传统 ( 软 伯 


的 模拟 仿真 对 比 原始 模 
器 定义 覆盖 率 功 能 模型 约 


Eds 


需要 分 


有 更 大 的 规模 和 


然 地 将 希望 寄托 在 片上 
PO 模拟 仿真 工具 界面 相似 


析 一 下 人 硬件 仿真 加 


加 速 的 间接 实现 方法 ， 与 〈 软 件 ) 


模拟 仿真 方法 相似 , 采用 基于 周期 和 基于 事件 两 种 基本 的 模拟 算法 , 所 不 同 的 是 算法 不 是 直 


Bi 


实现 方法 ， 直 接 将 竺 验证 设计 映射 到 硬件 的 逻辑 结构 


辑 设 备 (PLD) 或 现场 可 编程 


而 


现场 可 编程 


基于 代码 和 高 层 结构 框架 的 覆盖 率 评估 难以 实现 。 
了] 阵列 /硬件 模拟 引擎 二 者 结合 


门 阵列 和 


占有 


率 更 高 ， 从 而 使 得 基于 仿真 力 


件 仿真 加 速 器 速度 快 
性 ， 且 本 身价 格 比 较 晶 贵 ， 通常 只 


由 


误 后 在 现场 可 编程 
达到 软件 模拟 的 1000 倍 以 上 ， 可 
E， 同 时 可 以 进行 早期 的 性 能 评估 和 软 伯 


级 设计 的 验 说 


蔡 软 件 模拟 仿真 的 功能 。 


于 人 硬件 仿真 加 速 器 过 了 
设计 多 采用 现场 可 编程 门 阵 列 原型 来 加 速 验 计 
上 调试 非常 困难 ， 错 误 难 以 定位 ; 优点 是 非常 快 的 仿真 速度 ， 可 以 
PF， 可 以 在 设计 的 


门 阵列 J 


门 阵列 。 从 上 述 两 种 硬 伯 


目前 市 场 


j 于 大 规模 级 


Spa 


FE。 现场 可 编程 


两 种 ， 且 前 者 


晶 牺 牲 了 部 分 可 调试 性 ， 常常 要 求 设计 ,特别 是 测试 
路 设计 的 系统 级 验证 ， 不 能 完全 代 


昂贵 的 价格 , 在 硬件 仿真 加 速 器 普及 之 月 


门 阵列 验 订 


于 价格 相对 便宜 而 市 场 


软件 实现 ,而 是 基于 逻辑 处 理 器 网 络 实现 。 基 于 可 编程 逻辑 的 方法 称 为 仿真 加 速 的 直接 
可 编程 逻辑 阵列 (PLA)、 可 编程 罗 
仿真 加 速 方法 的 工作 原理 可 以 看 出 ， 
基于 便 件 模拟 引擎 的 方法 从 实现 原理 上 与 (软件 ) 模拟 仿真 类 似 , 最 有 可 能 文 持 履 善 率 评估 ， 
基于 可 编程 逻辑 的 方法 待 验证 设计 经 过 综合 和 硬件 映射 后 打 乱 了 RTL 原 有 的 结构 ， 使 得 
上 硬件 仿真 加 速 器 基本 分 为 基于 


1 速 器 的 覆盖 率 评估 难以 实现 。 此 外 ， 与 软件 模拟 相 比 ， 硬 
台 设计 ， 具 有 可 


1， 传 统 超标 量 处 理 器 


的 缺点 是 发 现 设计 错 


以 工作 在 实际 的 


和 否 能 应 用 于 片上 多 核 处 理 器 验 说 


日 标 环境 


E 


期 进行 系统 
FF 开发。 然而， 现场 可 编程 门 阵列 方法 是 
EF 直接 取 决 于 设计 的 规模 。 以 龙芯 处 理 吕 为 例 : 龙 世 2 号 设计 


规模 为 2640 万 个 晶体 管 , 可 勉强 烧 进 当时 能 买 到 的 最 大 容量 的 FPGA Xilinx Virtex5; 7545 3 
号 的 处 理 器 核 采 用 裁减 后 的 龙芯 2 结构 ， 双 核 结构 需要 2 片 增强 型 Xilinx Virtex5; 龙芯 3A 


为 四 核 结构 , 考虑 到 复杂 
于 现场 可 编程 


Virtex6。 


可 编程 


场 可 编程 


ME, 6 片 则 儿 乎 不 可 行 


上 


3 


门 阵列 验证 了 。 
现场 可 编程 门 阵列 提供 商都 在 努力 提供 
门 阵列 软件 , 但 与 集成 电路 设计 规模 的 增长 相 


事实 上 , 虽然 现场 可 编程 


系统 级 验 训 


Je e 
向 量 。 测试 向 量 生成 和 


E 的 容量 需求 。 
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模拟 还 是 便 件 仿真 加 速 、 现 场 可 编程 门 
全 终 是 需要 重点 关注 的 问题 。 六 


| 试 


更 大 容量 的 现场 可 编程 
Lt, 始终 


的 片 间 互 连 问题 ,容纳 该 设计 大 约 需 要 3~4 片 目前 最 大 容量 的 Xilinx 


门 阵列 互 连 管 脚 和 面积 限制 ，4 上 方 现场 可 编程 门 阵列 划 片 已 十 分 困 


F。 也 就 是 说 ，4 核 以 上 的 龙芯 3 号 设计 就 很 难 进 行 全 系统 规模 的 现场 


门 阵列 


门 阵列 领域 本 身 的 发 展 一 直 没 有 停止 ,各 个 


T 台 和 更 高 
难以 满足 大 型 集成 电路 设计 


效率 的 现 


阵列 原型 验证 都 需要 运行 大 量 的 测试 


句 量 来 源 可 以 是 实际 应 用 程序 或 专门 


片上 多 核 处 理 器 验证 综述 


书写 或 随机 产生 的 验证 程序 ,测试 向 量 的 随机 生成 是 处 理 器 仿真 验证 技术 发 展 过 程 中 重要 一 
步 , 使 验证 工程 师 不 必 总 是 面临 需要 搜 肠 刊 肚 书写 更 多 的 验证 程序 或 为 了 一 个 小 小 的 改动 不 
得 不 把 元 长 的 实际 应 用 程序 再 次 仿真 一 遍 的 窘境 。 随 机 测试 向 量 生成 技术 最 早起 源 于 上 世纪 
AFER, 经 过 研究 人 员 和 验证 工程 师 三 十 多 年 的 不 断 努 力 , 随机 测试 向 量 生 成 技术 经 历 了 
三 个 阶段 的 发 展 。 目 前 ， 对 于 普通 的 单 核 处 理 器 来 说 ， 随 机 测试 向 量 生 成 技术 已 十 分 成 熟 。 
2004 年 IBM 公司 的 阿迪 尔 (A. Adir) 等 人 建立 的 随机 程序 生成 器 GenesysPro 是 第 三 代 随 机 
测试 向 量 生成 技术 的 典型 工具 之 一 由。GenesysPro 主要 对 原始 随机 程序 生成 器 的 三 个 主要 半 
分 进行 了 改进 创新 : 首先 是 测试 模板 的 开发 语言 , 通过 使 用 该 语言 验证 人 员 可 以 描述 出 复杂 
的 程序 结构 ， 控 制 测试 程序 的 生成 行为 ; 第 二 个 改进 是 模型 化 的 处 理 器 结构 ， 在 GenesysPro 
中 对 于 处 理 器 模型 化 方法 的 优化 提供 了 高 度 抽象 的 多 种 可 配置 模块 模型 , 通过 使 用 这 些 模型 
验证 人 员 可 以 方便 地 生成 被 验证 处 理 器 的 基本 结构 模型 , 并 通过 该 模型 在 测试 生成 过 程 中 指 
导 程 序 的 产生 ， 改 进 的 第 三 部 分 为 随机 约束 生成 引擎 (CSPO. GenesysPro 是 有 文献 报道 的 
目前 工业 界 比较 成 功 的 随机 程序 生成 器 之 一 。 在 传统 随机 测试 向 量 生成 技术 领域 , 国内 国防 
科技 大 学 、 清华 大 学 、 北京 大 学 、 浙江 大 学 等 单位 以 及 中 科 院 计算 所 也 取得 了 一 些 研究 成 果 。 
国防 科技 大 学 和 北京 大 学 就 随机 测试 向 量 生 成 技术 发 表 了 一 系列 有 价值 的 学 术 成 果 ; 清华 大 
学 的 随机 测试 生成 器 已 申请 专利 一 项 ， 中 科 院 计算 所 2005 年 研制 的 指令 级 随机 验证 平台 在 
一 系列 关键 技术 上 取得 了 较 好 的 进展 , 实现 的 指令 级 随机 验证 平台 比 IBM Genesys 达到 相同 
履 盖 率 目 标的 收敛 时 间 缩 短 30% 左 右 ， 拥 有 与 GenesysPro 完备 程度 近似 的 功能 ， 已 经 成 为 
龙芯 系列 处 理 器 验证 的 标准 平 


即使 对 于 传统 的 超标 量 处 理 器 , 大 量 重复 履 盖 的 测试 向 量 造成 的 验证 效率 降低 和 资源 浪 
费 也 是 不 可 忽视 的 。 近 年 来 ,减少 重复 测试 向 量 ， 尽 量 用 最 少 的 测试 向 量 达 到 最 好 的 验证 履 
盖 率 ， 加 速 功能 验证 收敛 成 为 模拟 仿真 验证 方法 的 另 一 个 重要 研究 方向 。 


通过 覆盖 率 反 馈 驱 动 测试 向 量 生成 , 减少 重复 测试 向 量 , 加 速 功能 验证 收敛 是 优化 模拟 
仿真 验证 方法 的 重要 途径 。 相 关 研 究 主要 围绕 三 种 思路 进行 由。 意大利 都 灵 理 工大 学 
(Politecnico di Torino, Italy〉 的 科 尔 诺 (Fulvio Como) 等 将 基因 演化 算法 应 用 于 上 述 反 馈 
过 程 ， 提 出 了 测试 向 量 演化 (test program evolution) 方法 ， 基 本 策略 是 提出 一 个 小 的 初始 测 
试 向 量 集 ， 通 过 履 盖 率 反 馈 指导 的 一 系列 演化 得 到 优化 的 测试 向 量 集 。 该 方法 相对 于 人 工 的 
反馈 过 程 是 一 个 明显 的 进步 , 但 其 最 大 的 难点 在 于 初始 测试 集 的 选择 。 为 了 解决 自动 反馈 问 
题 ， 加 州 大 学 欧文 分 校 CUniversity of California, Irvine) 的 米 施 拉 (P. Mishra) 给 出 了 另 一 
种 思路 ， 先 把 待 验证 的 处 理 器 微 体系 结构 的 功能 点 抽取 出 来 建立 一 个 基于 图 的 设计 规范 
(Graph-based Specification )， 再 根据 设计 规范 建立 覆盖 率 模 型 ， 将 基于 图 的 设计 规范 作为 
输入 ， 采 用 形式 化 方法 遍历 设计 规范 ， 得 到 一 系列 的 测试 向 量 。 由 于 履 盖 率 模型 也 来 自 同 

个 基于 图 的 设计 规范 ， 很 容易 建立 履 盖 率 模 型 与 测试 向 量 之 间 的 对 应 关系 ， 实 现 “ 全 覆盖 ” 
验证 。 该 方法 最 大 的 问题 来 自 于 处 理 器 微 体 系 结构 功能 点 的 抽取 和 履 盖 率 模型 的 建立 。 如 果 
抽取 简单 的 功能 点 建立 模型 , 例如 米 施 拉 所 采用 的 处 理 器 流水 线 功 能 模型 ,该 方法 可 以 产生 
一 定 效果 , 但 是 如 果 抽 取 功 能 点 过 多 则 会 造成 模型 复杂 ， 形 式 化 的 禹 历 方法 直接 面临 “状态 
爆炸 ”等 一 系列 传统 难题 。 费 恩 CS.Fine). 等 提出 把 贝 叶 斯 网 络 技术 应 用 在 覆盖 率 动 态 反馈 
E, 在 基于 算术 指令 的 简单 模型 上 取得 了 一 定 效果 , 但 对 于 全 相连 的 复杂 状态 覆盖 率 转 移 模 
型 来 说 , 由 于 履 盖 率 模型 、 待 验证 处 理 器 属性 点 和 生成 的 测试 向 量 之 间 不 是 一 一 对 应 的 关系 ， 
而 是 复杂 的 网 状 联系 , 需要 建立 更 为 庞大 的 推理 库 , 高昂 的 实现 代价 限制 了 该 方法 的 可 行 性 
和 效果 。 显 然 ， 这 三 种 思路 都 未 能 真正 解决 覆盖 率 反 馈 驱 动 测试 向 量 生 成 的 问题 。 此 外 ， 以 
形式 化 覆盖 率 引 擎 反馈 驱动 测试 向 量 生 成 ， 达 到 加 速 验 证 收敛 的 目的 也 是 一 种 新 颖 的 思路 。 
无 论 上 述 方法 有 着 怎样 的 限制 , 实验 结果 都 显示 了 这 些 方法 对 超标 量 处 理 器 的 随机 验证 改进 
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有 一 定 作 用 。 


现 有 履 盖 率 驱 动 的 测试 向 量 生成 技术 几乎 都 依赖 于 歼 盖 率 度 量 技术 和 模拟 仿真 中 待 验 
证 设计 的 白 盒子 结构 。 当 处 理 器 设计 规模 更 大 、 结 构 更 加 复杂 时 ， 测 试 向 量 生成 规则 、 待 验 
证 设计 结构 、 履 盖 率 模型 之 间 的 对 应 关系 会 变 得 极为 复杂 , 即使 采用 最 先进 的 机 器 学 习 算 法 
也 难以 处 理 这 种 复杂 的 三 维 网 状 关系 。 为 了 进一步 简化 问题 ， 摆 脱 覆 盖 率 驱动 的 测试 向 量 生 
成 技术 对 待 验证 设计 结构 细节 的 依赖 ， 居 泽 伊 《0. Guzey) 和 郭 崎 等 分 别提 出 了 测试 向 量 过 
滤 技术 一 汪 ， 将 传统 的 在 测试 向 量 生成 时 进行 的 测试 向 量 精 简 工 作 挪 到 测试 向 量 生成 后 进 
行 ,采用 文 持 向 量 机 进行 测试 向 量 过 滤 。 考 虑 到 大 规模 设计 模拟 仿真 时 测试 向 量 的 生成 时 间 
远 远 小 于 其 运行 时 间 , 该 方法 虽然 增加 了 部 分 测试 向 量 生成 时 间 , 还 是 有 效 克 服 了 传统 履 盖 
率 驱动 的 测试 向 量 生成 技术 在 应 用 时 遇 到 的 难题 。 


前 面 介绍 了 测试 向 量 生成 技术 相关 的 一 系列 研究 成 果 , 那么 ,当面 对 复杂 的 片上 多 核 处 
理 器 时 , 这 些 研究 成 果 是 否 还 适用 呢 ? 首先 来 看 传统 的 已 经 十 分 成 熟 的 随机 测试 向 量 生成 技 
Ro 片上 多 核 处 理 器 与 普通 超标 量 处 理 器 相 比 不 仅仅 是 设计 规模 增 大 了 , 还 存在 着 结构 上 的 
创新 ， 在 如 何 为 同 构 / 异 构 多 核 、 多 线程 及 其 复杂 的 共享 存储 结构 生成 各 种 复杂 的 验证 程序 
以 及 复杂 共享 存储 程序 的 正确 性 验证 方面 , 需要 巨大 的 改造 和 创新 。 再 来 看 覆盖 率 反 馈 驱 动 
测试 向 量 生 成 技术 。 如 果 说 测试 向 量 精简 对 于 普通 单 核 处 理 器 设计 验证 十 分 重要 的 话 , 对 于 
设计 规模 更 大 、 模 拟 仿真 速度 更 慢 的 片上 多 核 处 理 器 来 说 ， 宛 余 测 试 向 量 问 题 将 变 得 无 法 容 
忍 ， 测试 向 量 精简 工作 将 变 得 更 加 必 不 可 少 。 遗 憾 的 是 ， 片 上 多 核 处 理 器 (软件 ) 模拟 仿真 
速度 慢 以 及 硬件 加 速 仿真 (或 现场 可 编程 门 阵列 原型 ) 方法 待 验证 设计 综合 后 代码 结构 不 可 
见 等 问题 给 覆盖 率 反馈 的 应 用 带 来 了 极 大 的 困难 ， 进 而 直接 约束 了 鹤 盖 率 驱 动 的 测试 生成 
技术 、 甚 至 测试 向 量 过 滤 技 术 的 应 用 。 要 解决 该 问题 ,未 来 需要 在 包括 片上 多 核 处 理 嚣 窗 盖 
率 度 量 、 待 验证 设计 划分 剪裁 、 测 试 向 量 多 层 反馈 生成 、 测 试 向 量 过 滤 等 一 系列 关键 技术 上 
实现 突破 性 创新 。 


除了 测试 向 量 生 成 外 , 基于 模拟 仿真 验证 的 另 一 个 关键 环节 是 正确 性 检测 。 常 用 的 正确 
性 检测 方法 包括 直接 结果 比较 、 记 分 板 〈Scoreboard) 技术 、 自 检测 〈Self-check) 技术 、 运 
行 后 正确 性 检测 技术 等 。 对 于 复杂 处 理 器 设计 来 说 ,结果 正确 性 检测 技术 通常 离 不 开 参 考 模 
型 建立 技术 的 支持 。 用 于 结果 比较 的 黄金 参考 模型 有 许多 种 ， 包 括 指令 集 参 考 模型 、 体 系 结 
构 参 考 模型 、 复 杂 处 理 器 节拍 精确 的 模拟 器 等 。 这 些 参考 模型 的 复杂 度 差 别 很 大 ,在 实际 验 
证 中 具体 采用 哪 种 参考 模型 还 需要 考虑 黄金 参考 模型 自身 的 正确 性 检测 复杂 度 问题 .对 于 大 
规模 片上 多 核 处 理 器 验证 来 说 , 建立 过 于 复杂 的 参考 模型 意味 着 需要 把 大 量 时 间 花 费 在 参考 
模型 自身 的 检验 上 。 当 参考 模型 复杂 到 一 定 程度 ， 其 验证 复杂 度 已 与 待 验证 设计 的 验证 复杂 
度 相差 无 儿 , 而 过 于 简单 的 参考 模型 则 可 能 丢失 一 些 重要 的 必须 检测 的 设计 属性 。 在 片上 多 
核 处 理 器 实际 验证 中 ， 要 根据 不 同 的 验证 需求 在 简单 易 检 验 的 模型 和 复杂 模型 之 间 进 行 折 
中 。 然 而 ， 对 于 片上 多 核 处 理 器 的 正确 性 检测 来 说 ， 参 考 模型 建立 问题 并 非 核心 难题 。 真 正 
的 难题 在 于 共享 存储 所 导致 的 结果 不 确定 性 问题 。 存 在 数据 竞争 的 测试 程序 在 共享 存储 多 处 
理 器 中 执行 结果 的 正确 性 由 存储 一 致 性 模型 定义 。 通常 的 存储 一 致 性 模型 包括 : 顺序 一 致 性 
(Sequential Consistency，SC)、 全 存储 顺序 (Total Store Order, TSO) 、 松 弛 存储 (Relaxed 
Memory Ordering，RMO) 和 释放 一 致 性 (Release Consistency，RC) 等 。 现 在 已 知 : 常用 的 共 
享 存储 模型 验证 执行 的 正确 性 问题 为 NP 完全 问题 , 这 直接 导致 片上 多 核 处 理 器 结果 正确 性 
检测 问题 的 计算 复杂 性 。 目 前 已 有 大 量 的 研究 围绕 如 何 将 检测 执行 正确 性 问题 变 为 多 项 式 或 
其 它 实 际 可 接受 时 间 内 完成 的 问题 进行 , 后 面 我 们 将 结合 片上 多 核 处 理 器 验证 实例 详细 讨论 
这 一 问题 。 
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人 缺陷。 形式 验证 通过 数学 方法 证 明 待 验证 设计 满足 规范 , 它 隐 含 考虑 了 所 有 
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称 表 达 式 是 可 满足 的 ， 和 否则 称 表 达 式 是 不 可 满足 的 。 很 多 电路 验 说 
然 SAT 问题 是 一 个 经 典 
目前 广泛 使 用 的 DPLL 算法 。 


现 了 相同 规范 的 所 有 操作 或 行为 , 是 到 目前 为 止 应 用 得 
验证 技术 。 目 前 等 价 性 检查 工具 已 广泛 集成 在 大 规模 集成 ! 
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因此 以 时 序 逻 辑 描述 。 如 果 自 动机 的 行为 符合 规范 ， 那 么 验证 成 功 ; 
的 一 条 路 径 ， 以 供用 户 分 析 。 这 种 方法 自动 化 程 
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因此 可 以 获得 更 大 的 处 理 规模 。 模 型 
有 了 较 大 的 提高 ， 
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还 有 一 个 关键 
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EF 理 的 范围 时 《时 间或 者 空间 


成 功 ; 


此 ， 除 了 前 面 所 述 的 原因 
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X, 
检测 是 


晶 是 这 些 方法 依然 有 着 指数 
LE 的 电路 规模 依然 有 限 。 迄今 还 没有 一 个 成 熟 的 自动 化 的 基于 模型 检测 的 
形式 验证 方法 能 在 广泛 的 复杂 工业 级 设计 上 取得 成 功 。 之 所 以 如 
素 : 在 电路 超出 模型 检测 工具 
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超过 限 
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模拟 仿真 验证 


使 STE 可 以 处 到 
过 三 值 仿 真 中 的 X 提供 了 
THAW ABE 


长 期 以 来 ， 尽管 形式 验证 理 


号 变量 又 为 抑 


分 需要 验证 。 
轨迹 
的 基础 上 ,通过 引入 三 值 仿真 和 
后 杨 〈 音 译 ，J Yang) 等 人 又 提出 了 广义 符 
无 限时 间 上 的 属性 。 
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STE 十 分 类 似 于 


TI 


诉 验证 人 员 已 经 验证 了 哪些 部 分 ， 还 有 哪些 


Fii (Symbolic Trajectory Evaluation, STE) 始 于 文献 [25,26]， 该 技术 在 传统 
o JÉI PUES U 
号 轨迹 评估 (Generalized STE, GSTE) 78, 


EF 方法。 此 


模型 检测 ， 但 是 其 优势 在 于 ， 通 


Zr 


+h 


t 了 手段 。 运 用 STE mi EE 


象 机 制 ， 以 便 扩 大 处 理 规 模 ， 同 时 


符号 仿真 中 的 符号 常量 


论 在 不 断 发 展 , 但 跟 不 上 


长 成 电路 了 


和 符 
I 象 程度 和 处 理 规 模 之 间 权 衡 。 


[ 艺 增长 、 设 计 规模 和 复 


杂 度 提高 的 脚步 ,“ 状 态 爆 炸 问 题 ” 的 阴云 始终 笼罩 着 形式 验证 ， 约 束 着 形式 验证 技术 的 大 


规模 全 自动 


业 级 应 用 。 鉴 于 形式 验证 


工 


的 处 


体 管 的 片上 多 核 处 到 


Edi T 


验证 的 重要 补充 ， 形式 验 训 
包括 三 个 方面 : 处 理 器 核 的 形式 验证 、 
器 核 中 运算 模块 的 形式 验 记 


三 个 方面 


中 ,针对 处 至 


前 形式 验证 
的 验证 显然 十 


EA 
mo 采用 形式 


长 ， 对 相关 形式 验 订 
克拉 克 (E.M. Clarke) 等 就 利 


f 


Wi 
采用 形式 验证 完 


究 
分 重要 。 


的 薄弱 


MZ, 


F 方 法 


环节 ,而 对 于 
前 各 种 形式 化 验证 方法 都 未 
正方 法 进行 处 理 器 核 级 完整 验证 的 实例 并 不 多 见 ， 
完整 处 理 器 核 级 验 订 
究 较 多 , 但 面 对 片 上 多 核 处 理 器 规模 的 快速 增长 ,片上 


片 


里 规模 有 限 ， 对 于 包含 数 千 万 乃至 
形式 验证 方法 来 对 其 完全 验证 是 不 可 能 的 。 但 作为 模拟 仿真 
乃 然 可 以 在 片上 多 核 处 理 器 验证 过 程 ! 
上 网 络 形式 验证 、 缓 存 (Cache) 一 致 4 


Zx 


发 挥 重 要 


F 已 较为 成 熟 ， 但 针对 控制 模块 
复杂 结构 的 片上 多 核 处 理 器 验证 来 说 , 针对 控制 模块 
动 化 程度 上 取得 双 
下 技术 的 发 展 ， 
然 近年 来 研 


能 在 处 理 规模 和 


E 应 该 是 可 以 期 望 的 。 片 上 网 络 形式 验证 虽 


随 着 形式 验 1 


rd 


FE 方法 的 可 扩 


网 络 需 要 连接 的 处 至 
展 性 提出 了 挑战 。 缓 存 一 致 性 协议 验证 开始 很 早 ，1992 年 
符号 模型 检验 器 (Symbolic Model Verifier, SMV) 首次 成 功 


LAL i 


作用 ， 主 要 
后 协议 验证 。 
的 验证 仍 是 


器 核 数 目 快速 增 


WUE J IEEE Futurebus+ 标 准 896.1-1991 缓存 一 致 性 协议 ,此 后 也 有 不 少 成 功 的 实例 。 然 而 ， 


缓存 一 致 性 协议 实现 


片上 网 络 之 上 ,在 具体 设计 中 ， 两 者 通常 相互 关联 形成 一 体 ， 且 随 着 


多 核 系 统 的 日 益 复 杂 , 存储 层次 也 有 1] 
这 些 都 给 形式 验证 带 来 了 新 的 挑 


化 ， 


uv 


事实 


上 ， 由 于 存在 健壮 性 和 可 扩 


在 工 


业界 设计 


H ge 


战 。 


展 性 问题 没有 解决 这 相 


i 程 和 方法 学 之 外 
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方法 相 结合 的 半 形 式 验证 成 为 验证 技 


AJ 


形式 设计 规范 ， 从 功能 正确 


He 


术 发 


用 于 一 此 


Y 


定 


展 的 趋势 。 相 关 的 研究 主要 畏 


泗 加 的 趋势 ， 多 级 缓存 必然 导致 缓存 一 致 和 


情况 。 近 年 来 


绕 在 处 理 器 微 体系 结构 的 形式 化 参考 模型 建 > 


性 检查 、 


履 盖 率 评估 到 测试 向 量 产生 


7 技术 上 ,重点 


由 于 这 种 思路 对 算法 级 形式 设计 规范 过 了 


为 设计 验 i 


考虑 如 何 利用 现 有 仿真 平 


和 基于 SAT 的 边界 模型 检测 ， 以 期 达到 更 好 的 履 盖 率 。 该 方法 优势 主要 体现 在 与 ! 
自动 化 厂商 原 有 的 仿真 平台 结合 紧密 ,速度 快 , 但 仍 存在 通过 提 


ZS 
ri» 


协议 的 复杂 


的 致命 伤 ,目前 形式 验证 仍 游离 
， 形 式 化 方法 和 模拟 仿真 
绕 两 种 思路 进行 。 学 
是 建立 算法 级 
都 依赖 规范 进行 。 


相应 的 ， 


FOR, 使 得 形式 设计 规范 本 身 的 正确 性 和 完整 性 成 
的 瓶颈 ， 同 时 存在 抽象 图 的 抽象 层次 对 验证 的 效果 影响 过 大 的 问题 。 
将 系统 级 随机 仿真 验证 与 模块 级 形式 验证 
的 验证 效果 ， 如 Synopsys 的 Megallan， 依 托 VCS 仿真 器 ,在 随机 仿真 验证 


工业 界 主要 


结合 起 来 , 达到 更 好 
插入 符 


号 仿真 


电子 设计 


ee 


人 大 态 机 提取 的 履 盖 率 状 态 


标准 单一 的 问 


di, 


验证 环境 的 通 


的 建立 ， 只 需 提供 断言 (assertion) 


同时 ， 处 理 规模 限制 仍然 是 目前 面临 的 主要 问题 
性 要 求 其 工具 对 所 有 
具 不 需要 关心 设计 的 内 部 结构 究竟 是 块 转 接 子 


的 IC 设计 具有 


= 


Brats Je REP 


。 此 外 ， 电 子 设计 自动 化 
普 适 性 ， 不 能 只 针对 处 理 器 验证 。 即 工 


述 语言 来 辅 


助 


因此 在 进行 处 


TRA 


RET 


EE 子 设计 自动 化 环境 结合 。 


器 ， 更 不 必 关 心 参考 模型 
户 自己 定义 断言 ， 进 行 正确 性 检查 。 
昌 户 仍 需 要 提供 知识 库 与 这 些 通 用 1 


当前 , 国际 


EH EE Eb 


片上 多 核 处 理 器 验证 


研制 也 
不 可 少 。 


片 


测试 的 管 肢 和 测试 通道 是 有 限 的 ， 这 限制 了 扫 


FE 在 实现 从 实验 室 原 型 至 


理 器 早已 成 为 处 理 嚣 市场 的 主流 产品 ， 国 
| 市 场 产品 的 跨越 。 对 于 大 规模 量 产 蔚 片 来 说 ,可 测 性 设计 必 


内 的 片上 多 核 处 理 器 


上 多 核 处 理 器 结构 复杂 ， 设 计 规 模 巨 大 ， 需 要 占用 大 量 测试 资源 。 片 上 可 以 用 于 


链 数量 ， 


导致 扫 描 链 的 长 度 迅速 增加 ， 结 果 


使 得 测试 时 间 变 得 难以 忍受 。 为 了 满足 片上 多 核 处 理 器 可 测 性 设计 要 求 , 大 量 可 测 性 技术 的 


创新 会 进一步 增加 片上 多 核 处 到 


度 。 


此 外 ,为 了 解决 片上 多 核 处 理 器 设计 下 
晶体 管 级 到 结构 级 , 在 各 个 设计 层次 应 
结构 级 低 功 耗 设计 、 门 控 时 钟 (Clock Gating)、 功 耗 门 控 (Power Gating)、 时 钟 树 的 低 功 耗 
设计 、 分 级 的 功 耗 状态 及 功 耗 管理 等 。 这 些 所 带 来 的 设计 复杂 度 的 提高 使 本 就 困难 的 片 


核 处 理 器 验证 雪上 加 霜 。 
2.2 硅 后 验证 


在 过 去 的 20 年 间 ， 集 成 电路 硅 前 验 订 


器 设计 的 复杂 度 , 从 而 进一步 增加 片上 多 核 处 理 器 的 验证 难 


E 水 平 取得 了 长 足 的 进展 ， 然 而 ， 与 快速 发 展 的 工 
艺 水 平和 集成 电路 设计 水 平 相 比 , 仍然 难以 满足 大 规模 复杂 集成 电路 验证 实践 的 需要 ,常常 


临 的 男 一 个 重要 问题 一 一 降低 功 耗 , 设计 人 员 从 
各 种 手段 和 技术 。 目 前 低 功 耗 技术 的 常用 方法 包括 


上 -多 


会 有 各 种 错误 和 问题 “ 逃 过 ” 硅 前 验证 进入 制造 环节 。 事 实 上 ， 以 片上 多 核 处 理 器 为 代表 的 


现代 大 规模 复杂 设计 ， 无 论 
片 或 者 系统 级 芯片 《SoC)， 都 面临 着 因 种 种 问题 导致 的 芯片 多 次 流 片 问题 。 
International Research 研究 报告 指出 ，37% 专 用 集成 
需要 3 次 以 上 的 流 片 。 另 有 报道 称 71% 的 重复 流 片 源 于 逻辑 错误 ， 


BE 路 蕊 片面 临 2 次 流 片 ， 其 中 24% 其 至 


从 是 高 性 能 全 定制 蕊 片 、 半 定制 芯片 、 专 用 集成 电路 (ASIC》 蕊 


AE ng 


Collett 


其 余 形 形 色色 的 错误 和 


问题 则 与 设计 边界 条 件 、 功 耗 、 电 压 、 温 度 等 各 种 物理 电气 特性 相关 《甚至 与 物理 设计 中 组 


FH 


最 少 的 流 片 代价 将 错误 阻 


用 户 时 仍然 必须 保证 其 正确 性 ， 


的 召回 成 本 为 600 亿美 元 )， 看 似 昂贵 的 硅 后 验 订 
， 因 此 ， 近 两 年 来 ， 硅 


INIR ILKA 


侍 后 验证 


片 行为 的 正确 性 ， 目 标 是 保 记 


后 验证 主要 包括 四 个 步 又 : 


(1). 


通过 在 实际 应 用 环境 
FE 不 要 使 错误 “逃逸 ”到 应 用 领域 (用户 手 中 )。 一 般 来 说 ， 硅 


通过 运行 测试 程序 来 发 ] 


运行 一 个 或 多 个 制 


作 系统 、 游 戏 、 科 学 计算 等 ) 都 有 ， 各 种 大 大 小 小 的 测试 程序 会 一 直 运 行 ， 


发 生 失 效 〈 如 系统 骨 溃 、 段 错误 或 例外 等 ); 


从 大 的 系统 失效 中 将 问题 定位 到 一 个 较 小 的 区 域 。 


发 现 问题 的 根源 。 例 如 ， 某 错误 可 能 是 由 于 电源 噪声 导致 的 一 一 电源 噪声 会 减 慢 电路 


(2). 

溃 可 以 被 定位 为 在 某 种 应 月 

激励 一 一 特别 是 错误 暴露 得 到 的 出 错 点 周围 数 十 行 
(3). 

某 一 路 径 上 的 信号 传输 ， 导 致 在 某 种 输入 
(4). 

A T AE TILT o 

从 硅 后 验证 的 目标 和 实施 步骤 来 看 ， 硅 
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序列 下 一 些 设计 模块 输出 错误 。 


修复 或 旁 路 问题 。 可 以 采用 打 补 丁 、 电 路 编辑 等 方法 进行 修复 ， 极 端 状况 下 需要 采用 


冲 电路 Cbuffer) 的 摆 放 位 置 相 关 )。 面 对 这 些 情况 ， 芯 片 设 计 者 和 验证 人 员 所 能 做 的 就 是 尽 
三 在 硅 后 验证 阶段 。 考虑 到 无 论 面 对 怎样 的 困难 , 在 芯片 交付 
否则 就 要 付出 惨重 的 代价 ( 非 官方 的 评估 认为 奔腾 4 处 理 器 
F 比 起 错误 逃逸 造成 的 后 续 问 题 来 说 完全 是 
后 验证 变 得 越 来 越 重要 …”。 


造 后 芯片 来 验证 各 种 操作 条 件 下 芯 


岗 问 题 。 这 些 测试 程序 从 随机 指令 序列 到 终端 用 户 应 用 (如 操 


直到 系统 


列 如 :一 个 复杂 处 理 器 上 的 程序 出 


日 工作 流下 指令 调度 器 产生 的 错误 ， 能 够 暴露 出 错误 的 测试 


尺码 非常 重要 。 


后 验证 与 硅 前 设计 验证 和 制造 测试 有 些 相 似 之 
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方面 都 与 后 两 种 
由 于 现 有 技术 难 


以 应 对 复杂 芯片 硅 后 验证 需求 ， 


的 重视 ， 


硅 后 


观测 性 与 可 调试 
待 解决 。 


除 上 述 外 ， 国 
理 器 验证 方面 的 文献 不 多 。 江南 
研究 与 实践 工人 
学 姚 文 斌 等 开发 了 


FE， 在 测试 向 量 生 成 、 缓 存 一 致 必 
款 简单 的 单 片 多 处 到 


计算 所 、 国 


验证 已 经 变 得 极为 困难 日 
断 增 大 的 设计 规模 和 日 趋 复 杂 的 设计 结构 沪 
的 角色 ,并 最 终 变 得 不 可 或 缺 。 作 为 一 门 新 兴 的 技术 ,尽管 近 
IF ine, IBM. WR, AMD, ARM 等 公司 及 学 术 界 莉 
讨 和 研究 相关 技术 ,但 总 的 来 说 ， 硅 后 验 i 
生 、 履 盖 率 度量 、 芯 片 耐 受 性 和 修复 机 竺 


E 定 硅 后 验证 将 在 其 


内 也 有 一 些 学 术 机 构 从 事 片 上 多 核 处 
防 科技 大 学 训 


[代价 昂贵 。 片 上 多 核 处 理 器 不 


FRITHE! 


扮演 越 来 越 重要 


古 年 硅 后 验证 越 来 越 受 至 
投入 了 不 少 精 力 探 
正 研究 目前 仅 处 于 起 步 阶段 ， 在 错误 重 放 、 系 统 可 
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| 等 许多 方面 都 存 
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片上 多 核 处 到 


E 的 研究 , 但 关于 片上 多 核 处 
器 验证 


rH 


开展 了 大 


EARS I 


开发 和 系统 验证 的 功能 5 
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工作 , 取得 了 不 少 研究 成 果 ; 
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中 国 科学 技术 大 学 苏州 
已 申请 发 明 专 利 两 项 ; 出 
限于 篇 幅 ， 此 处 不 再 

前 面 对 验 证 领域 国 
的 局 限 性 ， 下 面 将 结合 商用 CM 
及 挑战 。 
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为 8-16 核 ， 蕊 片 设计 横 跨 


外， 另 有 其 他 一 些 单 


定制 、 


究 院 就 片上 多 核 处 理 器 的 并 行 仿真 


F 环 境 S-CMP, Kill 


验证 等 方面 取得 了 一 系列 在 


完成 果 ; 清华 大 


FE 环境 同 时 承担 结构 设计 


K 动 的 测试 向 量 生成 方 
科 院 计算 所 依托 龙芯 3 号 系列 多 核 处 型 


面 


上 多 核 处 理 器 验证 研究 ， 目 前 已 在 测试 向 量 生 成 、 存 储 一 致 性 验证 、 
ARRE, WEKE 


发 了 多 核 系统 级 芯片 软 硬 伯 


ufi 


开展 了 一 系列 
器 设计 全 面 


骨 试 性 设计 等 


P 处 理 器 验证 实例 


| 


HL, 片上 包含 有 


具体 说 明 当 前 片 J 


商用 片上 多 核 处 理 嚣 验证 实例 及 问题 


商业 化 的 片上 多 核 处 理 器 已 经 面 ] 


半 定 制 、 


专 


集成 


耗 设计 等 ) 
ERA 


实现 及 性 能 分 析 ， 详 


上 多 核 处 理 器 相关 的 公开 参考 文献 ， 


和 片上 多 核 处 理 器 验证 中 的 某 


RyA 


> IRK 


H 


细 


上 ， 近 两 年 来 ， 硅 后 验证 相关 和 
证 实践 综述 ,此 类 文献 对 于 全 面 


i 
Eat E Ate, 


EAE E 


^, 


PR, up "pr". 


了 解 和 


存储 一 致 性 验证 方面 的 研究 可 追溯 到 大 规模 并 行 处 也 
序 在 共享 存储 多 处 理 器 中 执行 
(Compaq) 公司 的 泰勒 CS. Taylor) 等 描述 了 一 种 基于 仿真 的 验 训 
页 序 模型 ,用户 可 以 通过 对 照 原始 的 结构 正 
该 方法 缺点 在 于 处 理 器 一 致 性 模型 对 特殊 属性 实现 的 依赖 
j， 改 进 新 的 版 本 。 此 外 ， 缺 乏 形 式 化 证 明 所 建立 的 
F 就 会 隐患 重重 ， 可 能 


义 了 存在 数据 竞争 的 程 


的 方法 , 该 方法 通过 直接 的 无 环 
确 性 定义 验证 实现 的 各 个 方面 。 


性 ， 需 


” 康 柏 


发 的 一 款 微 处 理 器 


要 为 每 次 处 理 器 改进 建立 新 的 规 贝 
存储 顺序 模型 的 正确 性 。 没 有 模型 正确 性 的 保证 ， 基于 模型 的 仿真 验 订 


分 用 于 
述 片 上 多 核 处 理 器 验 1 
\ 体 问题 或 技术 , 此 类 点 式 研 
究 也 开始 逐渐 进入 人 们 的 视线 ; 
把 握 片 上 多 核 处 到 


内 外 研究 现状 进行 了 概括 , 分 析 了 现 有 技术 应 对 片上 多 核 处 理 器 验证 
上 多 核 处 理 器 验证 的 现状 


协同 验证 
展 了 一 些 研究 工作 ,大 
位 也 在 多 核 处 理 器 研制 和 验证 方面 有 所 涉 猪 ， 


I. Z [54]. 


究 成 果 


Rl 


的 处 理 器 核 个 数 也 从 初始 的 双核 发 展 
路 、 系 统 级 芯片 等 多 种 流程 。 在 片 
煌 述 结构 设计 /物理 设计 〈( 包 提 
正 的 不 多 ， 大 致 可 分 为 两 


MRIJ 


一 类 


NL 
ASN. 


RER 


器 验证 来 说 非常 珍贵 , 可 


E CMPP) 时 代 。 存 储 一 致 性 模型 定 


在 存储 一 致 性 验证 
第 二 类 是 片上 多 核 处 理 器 验 


Zt 


=H 


图 建立 存储 访问 


J 


果 是 否 正 确 


E Alpha 结构 


此 数量 很 


的 标准 。 原 康 样 
k 享 存储 属性 


发 生 放 过 冲突 其 


至 误 报 错误 等 各 利 


状况 。 


片上 多 核 处 理 器 验证 综 


现在 已 知 ， 常 用 的 共享 存储 模型 验证 执行 的 正确 性 问题 为 NP 完全 问题 ， 因 而 更 多 的 研 


究 围 绕 如 何 将 检测 执行 正确 性 问题 
由 于 存储 一 致 性 结果 分 析 技 术 并 不 完备 , 许多 下 


说 可 以 解决 上 述 确 


状况 ， 其 他 情况 结果 则 无 法 确 
斯 坦 福 大 学 的 马 诺 维特 〈C. Manovit) 和 杭 格 尔 CS. Hangal) 
该 分 析 算 法 仅 依 赖 程序 可 见 的 结果 , 不 需要 额外 的 系统 内 部 信 


定 ， 


定性 问题 。 


HB. 且 算 法 工 
的 又 一 种 折衷。 


储 子 系统 行为 的 程序 。TSOtool X 
(Total Store Order，TSO) 一 致 性 模型 的 系统 上 运行 具有 


检查 程序 运行 结果 是 否 符合 
) 等 采用 形式 化 方法 验 订 


IBM [NFER (D. G. Bair 


可 以 运行 在 真实 的 商业 处 理 器 上 。 H 
杭 格 尔 等 设计 了 一 种 TSOtool 


变 为 多 项 式 或 其 它 实际 可 接 


究 上 只 标记 可 以 i 
通常 都 乐观 地 假设 机 器 的 执 


受 时 间 内 完成 的 问题 5 9。 
FE 明 的 违反 存储 一 致 性 模型 的 
行 结果 是 正确 


的 。Sun 公司 / 


述 了 一 种 实用 的 新 


单独 的 单元 级 仿 
验证 性 
Naz HAS ROBES TE: 


朋 度 思考 设计 问题 ， 提 出 为 了 能 
(1). 强制 一 臻 《coherence ) F03 
Wig: (2). 缓存 一 致 性 协议 与 互 连 结构 脱钩 。 方 法 是 不 要 依赖 
并 进一步 分 析 了 在 两 类 主要 的 缓存 一 致 特 


一 种 在 共享 


真 验证 环境 。 宾 州 大 学 的 马丁 (Milo M.K. Martin) MKH 


法 ， 据 


实 该 算法 只 是 实现 了 精确 性 和 运行 时 间 
存储 的 片上 多 处 理 器 上 检查 存 
] 了 一 个 改进 的 多 项 式 时 间 的 算法 ， 在 采用 全 定 序 存储 
数据 竞争 的 伪 随 机 测试 程序 ， 然 后 
形式 化 的 全 定 序 存储 规范 。 这 种 方法 虽然 不 完备 ， 但 实际 有 效 。 
FE 存储 一 致 性 协议 ， 同 时 为 存储 控制 


器 搭建 
思维 ， 从 可 


车 多 处 理 器 系统 验证 


1 


应 用 形式 验证 , 多 处 理 器 系统 
存储 一 致 性 〈consistency) 模型 


和 王 何 特殊 互 连 顺序 和 同步 属性 。 
FE 协议 一 一 日 录 机 制 和 监听 协议 ,认为 目录 机 制 比 监 


听 协 议 更 符合 要 求 。 指 出 尽管 监听 协议 概念 简单 ， 听 起 来 更 诱 人 , 但 其 实现 不 符合 上 述 退 慕 


要 求 ， 推 理 、 验 证 和 正确 


实现 较 革 


了 协议 的 设计 和 验证 。 目 


验证 性 需求 ， 认 为 这 样 验证 丰 
很 多 , 例如 物理 设计 水 平等 , 给 结构 设计 增加 了 很 
年 ,陈云 宅 等 提出 在 片上 多 核 处 至 
利用 时 间 序 , 可 以 在 不 损失 精确 


前 只 有 有 


TD 


设计 都 会 事半功倍 。 然 而 ， 考 虑 


难 。 反 之 ， 目 录 机 制 看 似 复 杂 ， 但 更 符合 退 耦 要 求 ， 简 化 
分 设计 采用 了 上 述 退 耦 规则 , 作者 倡议 在 设计 时 考虑 可 
到 影响 处 理 器 结构 设计 的 因素 
多 限制 ， 上 述 倡 议 看 来 难以 实现 9。2009 


性 的 情况 下 有 效 地 将 片上 多 核 处 到 


部 化 ， 将 存储 一 致 性 验 计 


O(n), SHAG HESS AR REH 
ts faj e 


的 极 大 重视 。 


系统 中 访 存 操作 之 间 存 在 一 种 自然 序 关系 , 称 为 < 时 间 序 ”。 


器 存储 一 至 性 验证 问题 局 


Ff] EAS EFE O( p3n)， 引 入 微 结构 相关 知识 进而 将 复杂 度 降低 为 


的 片上 多 核 处 理 器 存储 一 致 性 验证 El。 此 外 ， 谢 赫 CA. A.Sheikh) 


述 了 基于 系统 级 芯片 的 异 构 多 处 开 


硅 后 验证 作为 新 兴 的 技术 领域 近来 得 到 了 广泛 的 关 沪 
领域 的 国际 顶级 会 议 设计 自动 化 会 议 (Design Auto 
WKH IBM, KFK, Qualcomm 、 
家 与 世界 各 地 从 事 验 证 研究 的 学 者 展 ] 


在 商用 处 理 器 领域 ，2007 F, IBM, WRA AMD 分 别 首次 发 表 了 关于 奎 


器 系统 的 系统 级 验证 方法 。 


mation Conference， 


E 和 重视 ，2010 年 电子 设计 自动 化 


DAC) 上 就 该 领域 


了 深入 讨论 , 表现 了 工业 界 和 学 术 界 对 硅 


ARM 等 验证 团队 的 负责 人 人、 电子 设计 自动 化 业界 专 


后 验证 领域 


后 验证 的 文 


章 。 有 趣 的 是 ， 三 篇 文章 都 强调 了 多 核 处 理 器 ， 这 从 一 个 侧面 佐证 了 多 核 处 理 器 加 剧 了 “ 验 


证 危机 ”并 直接 


存 一 致 性 、 


Ez) T TEJE u 
器 芯片 IBM Cell/B.E UR S ak Vi Lb FH A aS Hr E c er Ds MA 
E TLB 77 IDA AASB 
后 验证 方法 , S 


TLB“ 一 致 性 、 软 件 管 到 
特 尔 描述 了 其 双核 处 理 器 Core2 Duo 的 硅 
及 代 工 厂商 (OEM) KAK 


Eft vgl" =, 


FE 三 个 方面 ， AMD 则 将 硅 


I 进行 了 非常 简单 的 介绍 ; 


IBM 重点 描述 了 其 设计 的 一 款 异 构 多 核 处 理 


] 例 的 生成 、 绥 


M 


Js ul 


了 系统 验证 、 兼 容 性 验证 以 
划分 为 三 个 阶段 ， 初始 阶段 主 


要 执行 基础 诊断 和 加 载 操作 系统 , 中 间 阶 段 会 运行 各 种 各 样 的 平台 以 及 相应 的 软件 以 验证 处 


4 翻译 后 援 存 储 器 ，Translation Lookaside Buffer 
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理 器 的 功能 和 兼容 性 ， 最 后 阶段 则 主要 关心 内 存 一 致 性 、 内 存 排序 、 缓 存 一 致 性 和 缓存 原子 
性 。 文中 还 描述 了 奎 后 错误 调试 的 过 程 。 2010 4E, ARM 公司 首次 表达 了 对 硅 后 验证 的 重视 ， 
表 了 题 为 “ 硅 后 验证 已 开始 得 太 晚 一 通过 设计 验证 避免 生产 5000 万 美元 的 镇 纸 ” 的 文 
ABI, ARM 是 国际 上 市 场 占有 率 最 高 的 集成 电路 TP 核 提 供 商 。IP 核 通常 分 为 软 核 、 硬 核 
和 固 核 三 种 。 这 决定 了 ARM 公司 的 硅 后 验证 更 像 硅 前 验证 的 延续 ， 其 产品 对 低 功 耗 设计 的 
极度 重视 也 使 得 复杂 低 功 耗 设计 验证 成 为 其 硅 后 验证 的 重点 。 总 的 来 说 , 目前 商用 处 理 器 关 
于 硅 后 验证 的 文献 很 少 且 较 为 浅显 , 并 未 触及 硅 后 验证 领域 如 错误 重 放 、 系 统 可 观测 性 与 可 
调试 性 、 履 盖 率 度量 、 芯 片 耐 受 性 和 修复 机 制 等 许多 核心 问题 ， 而 这 些 问题 仍 是 横 豆 在 硅 后 
验证 面前 的 重要 挑战 。 
近年 来 ， 昌 然 著名 的 处 理 器 厂商 英特尔 、IBM、AMD 等 纷纷 推出 自己 的 多 核 处 理 器 ， 

但 关于 片上 多 核 处 理 器 验证 实践 综述 类 的 描述 却 较 少 见 诸 文献 ,只 有 IBM 粗略 描述 了 Power 
RJ A ERE ERIS ESE 777, DR NEC 从 验证 管理 角度 对 肉 入 式 多 处 理 器 验证 稍 有 涉 
Ko eee READS) TS = SIL 


NEC 公司 面向 高 性 能 、 低 功 耗 的 消 ” 表 2. IBM Power 系列 处 理 器 及 其 系统 描述 [9| 


费 电 子 领 域 ， 设 计 了 一 球 片 上 多 处 理 器 规格 说 明 
原型 一 Merlot 来 证 明 其 猜测 多 线程 结构 。 页 数 
Merlot 集成 了 片上 设备 、PCI” 接 口 和 基于 Power 的 
SDRAM5 接 口 ， 芯 片 设计 涉及 目前 的 片 Power&t 高端 服务 器 
上 多 处 理 器 和 系统 级 芯片 设计 领域 。 文 LAS Be 
献 从 工业 化 验证 管理 的 角度 介绍 了 多 线程 
Merlot 的 验证 ， 详 细 描 述 了 Merlot 设计 Power5 微分 割 
流程 、 验 证 环境 、 验 证 层次 和 验证 流程 ， 新 读 写 芯片 
站 出 严格 的 设计 规则 和 验证 流程 对 保证 增强 型 存储 子 系统 
验证 成 功 的 重要 性 。 Power5+ | 增强 型 Power5 系统 
IBM Power 系列 处 理 器 及 其 系统 Power6 | Power5+ 的 增强 型 
述 如 表 2 所 示 〔 该 表 中 尚未 包括 IBM 最 Cel | Power AIAN A 38 
新 的 Power7. 8 核 处 理 器 ， 后 面 将 对 其 Power4+ | 高 端 Power 处 理 
验证 进行 单独 介绍 ) ee: 多 线程 
微分 割 
Cell Broadband Engine(Cell BE) 是 由 Power5+ | Power5 的 增强 型 
Ae. ZZ. IBM 联合 开发 的 。Cell BE 二 款 64 位 
是 以 IBM 研发 的 64 位 POWER 为 核心 P-X 


Power 芯片 
Power6 | 对 Power5+ 的 强 型 
Bridge#1 PCI 桥 


(PPE), 2577 8 个 互相 协作 的 处 理 机 单 
JÙ (SPES) 构成 的 处 理 器 。CEBA 架构 
可 适用 于 多 样 规 划 设 计 ， 并 且 文 持 PPE 
和 8 个 SPEs 分 离 工 作 。 芯片 | Bridget E at 

验证 包含 2.34 亿 个 晶体 管 的 Cell 
Broadband Engine 涉及 跨 五 个 时 区 的 五 个 参与 公司 的 庞大 团队 ， 项 目 管 理 复杂 ， 非 常 具有 挑 
战 性 。 在 验证 Cell 的 过 程 中 ， 基 于 仿真 的 验证 技术 在 验证 过 程 中 发 挥 了 决定 性 作用 ， 验 证 
策略 包括 层次 化 验证 (hierarchical verification)、 随 机 验证 (random verification) 和 基于 跟踪 的 结 


? Peripheral Component Interconnect， 互 连 外 围 设备 
° Synchronous Dynamic RAM, 同步 动态 存储 器 
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构 验证 (trace-based architectural verification). 随机 验 订 


片上 多 核 处 理 器 验证 


F 环 境 包括 一 个 输入 端 动 态 测试 向 量 产 


生 程序 和 一 个 输出 端的 动态 检测 程序 。 随 机 测试 向 量 产生 程序 是 系统 级 的 X-Gen。 结 果 检 测 
有 两 种 方法 : 模块 级 的 实时 检测 和 蕊 片 级 的 基于 跟踪 的 验证 。Cell 首次 流 片 前 共 仿 真 了 超过 


2 万 亿 个 节拍 ， 流 片 回来 后 


POWER4 和 POWERS 都 是 用 了 


Power4 处 理 器 包含 两 个 CPU f, fj AF 
数据 缓存 , 两 个 核 共 享 三 个 512KB ZRET., 
128MB。 对 于 POWERA 的 验 订 


到 
和 积累 的 验证 工 
举 的 已 命名 的 验证 
等 价 性 检查 工 


y 
FM 


A Verity, Dyfi 
Abacus 及 Covet， 模 块 级 验证 
H. Genie, Genesys 和 GenesysPro, 


民 快 就 能 运行 操作 系统 和 一 些 应 用 。 


F IBM 服务 器 
万 行 VHDL7 代 码 和 1.74 (Gtk hE, POWERS 包括 2.76 亿 晶 体 管 ， 


E, IBM 公司 
加 以 改进 外 ， 还 专门 为 POWER4 的 验证 
工具 就 多 达 15 F 


hs 包括 仿真 工 


第 三 级 缓存 采 
H] 


TEEBA. RI? 


开发 了 新 的 验证 
H TexSim/TexVHDL, ,硬件 加 速 器 AWAN, 


工 


形式 验证 工具 RuleBase， 四 个 覆盖 率 工 


(不 包括 随机 验证 程序 )， 


如 此 大 而 
德 克 萨 斯 州 的 奥 


Br] 


把 这 些 错 误 绕 过 去 。 


Power5 是 IBM 


线程 (Simultaneous Multithreading, SMT) 处 到 
1.92MB 的 二 级 缓存 ， 此 外 还 集成 了 三 级 缓存 的 
因此 对 POWER4 的 验 说 


POWER4 的 向 上 兼容 


一 致 性 检查 工具 
片 核 级 和 系统 级 等 多 个 层次 进行 验证 。POWER 系列 处 理 器 
中 15 万 个 测试 集 在 每 一 级 模型 和 每 次 VHDL 修改 后 的 版 本 
的 回归 测试 中 都 要 使 用 , 而 在 较 大 的 修改 发 布 时 必须 完成 全 部 测试 集 的 回 
复杂 的 处 理 器 设计 ，IBM 动用 了 数 千 台 pSeries 工作 站 和 服务 器 的 机 群 ， 分 另 
和 明尼苏达 州 的 罗 彻 斯 特 , 每 处 机 群 都 以 100M 以 太 网 互 连 , 仿真 环境 
的 平均 处 理 能 力 为 10 亿 节 拍 / 天 。 尽 管 如 此 ，POWER4 第 一 版 2000 年 流 片 回来 ， 在 多 种 配 


置 上 成 功 运 行 AIX 和 LINUX 以 后 ， 还 是 发 现 了 一 些 漏网 (bug)， 只 好 通 


- Bugspray、Comet、 
工具 TIMEDIAG 和 GENRAND， 随 机 指令 级 测试 用 例 生 成 了 


系统 的 双核 微 处 理 器 。POWER4 包括 150 
结构 复杂 。 


器 核 拥 有 64KB 一 级 指令 缓存 与 32KB 一 级 
用 eDRAM 内 存 , 容量 从 32MB 
各 以 往 POWER 系列 总 结 
Lo 仅 文 献 列 


CML 等 


， 在 模块 级 、 单 元 级 、 多 单 


元 级 


O E 


JN AN 


出 的 双核 同时 多 线程 处 


里 器 ， 集 成 了 两 个 处 理 器 核 ， 每 个 核 为 同时 


录 及 存储 控制 器 。 
全 部 被 移植 


F 方 法 


器 ， 能 够 同时 执行 两 个 线程 ， 


^ 


了 大 约 50 万 个 常规 测试 


归 测 试 。 为 了 仿真 
ete 


过 软件 或 性 能 降级 


多 
片 内 集成 了 
因为 POWER5 是 对 
来 应 对 POWERS 的 验证 。 


除 此 以 外 ， 还 针对 POWERS 的 验证 提出 了 很 多 新 工具 和 技术 改进 : 包括 同时 多 线程 增强 型 
测试 用 例 产生 工具 MultiProcessor Test Generator (MPTG)、 系 统 级 测试 用 例 加 载 、 执 行 、 规 


则 检查 、 结 果 检 验 工 


Genesys-Pro 进行 了 改进 。 


在 Power 5 的 验证 过 程 中 采 


验证 事件 都 有 特定 
人 员 、 
验证 测试 覆盖 率 。 
测试 用 例 的 运行 过 程 


EF) Power 5 的 验 记 


的 效率 ， 并 保证 最 高 优先 级 的 测试 事件 
,，i5/OS) 启 动 ， 


片 支持 操作 系统 (AIX，Linux 


”VHSIC hardware description language， 超 高 


i SPECTOR、 读 写 测 试用 例 产 4 
工具 SixthSense、 轿 盖 率 分 析 数 据 库 Meteor 系统 并 配合 


新 特性 优先 法 则 ， 保 记 
并 且 从 Power 4 采用 大 量 的 随机 产生 的 测试 用 例 转向 Power 5 : 
的 测试 目的 ， 所 有 与 Power 5 相关 的 测试 事件 被 标记 为 最 高 优先 级 。 验 证 
体 实 现 设 计 人 员 和 体系 结构 设计 人 员 共 同 决定 哪些 Power 5 的 ] 
E 定 义 了 超过 35,000 个 测试 用 例 
Ee 中 ,验证 系统 不 间断 地 搜集 统计 数据 ,排除 无 效 的 涡 


LE 形式 化 的 验 订 


的 以 验 i 


p 


sp 


HEALEY BL Ti o 


并 在 流 片 之 前 


速 集 


成 
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路 硬件 描述 语言 


Power5 的 验证 团队 保证 
发 现 了 95% 的 设计 问题 ， 只 剩 下 不 


ETA X-Gen、 增 强 型 测试 覆盖 率 分 析 
FF 工具 SixthSense 对 


于 规模 更 加 庞大 ， 对 Powers 的 验证 在 方法 论 上 有 了 重大 变化 ， 引 入 了 验证 优先 级 的 
概念 。 与 Power 4 相 比 ，Power 5 具有 更 复杂 的 结构 ， 但 是 也 重用 了 Power 4 的 设计 。 因 
F Power 5 的 新 特性 得 到 更 深入 的 验证 。 
正事 件 为 导向 ， 每 个 


此 


力 能 单元 需要 更 高 的 


1 试用 例 以 


以 覆盖 验证 事件 。 在 


提高 验证 


I HX 


L 
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到 1% 的 设计 问题 会 影响 芯片 的 使 用 。 验 证 团队 进一步 通过 软件 改进 等 其 它 方法 提供 了 对 于 
这 些 设计 问题 的 解决 方案 。 


Power7 是 IBM 第 一 款 高 端 8 核 处 理 器 。 与 此 前 IBM Power 系列 产品 相 比 ，Power7 处 
理 器 不 是 处 理 器 核 的 简单 堆砌 , 而 是 有 许多 重大 的 结构 创新 , 首次 实现 了 共享 片上 三 级 缓存 ， 
缓存 基于 嵌入 DRAMP QC, ifi dE SRAM， 并 被 集成 到 芯片 中 。 芯 片 在 567 mm^ 上 集成 了 12 
亿 唱 体 管 ， 八 个 处 理 器 核 采 用 4 路 对 称 多 线程 (symmetric multithreading, SMT) 结构 连接 ， 
设计 了 私有 二 级 缓存 及 前 述 共享 三 级 缓存 ， 为 SMP 连接 提供 了 7 个 连接 端口 ， 两 个 内 存 控 
制 器 可 传输 100 GB/s 的 数据 ， 还 为 远程 访 存 (Remote Access Service, RAS) 和 电源 管理 
提供 了 附加 功能 。Power7 的 一 系列 结构 创新 导致 片上 晶体 管 数量 急剧 增加 。 尽 管 增加 的 蝇 
体 管 大 部 分 用 于 增加 缓存 大 小 以 及 提高 多 核 并 行 性 , 但 仍 有 大 量 晶体 管用 于 开发 更 复杂 的 功 
能 ， 从 而 加 剧 了 “状态 空间 爆炸 ”现象 ， 而 其 多 锁 相 环 PLL) 和 组 件 间 多 种 多 样 的 异步 接 
口 设计 更 使 业已 十 分 困难 的 验证 更 加 困难 。 尽 管 IBM 在 完成 此 前 一 系列 多 核 产 品 〈 如 前 述 
Cell, Power4, Power5 等 ) 验证 的 过 程 中 积累 了 大 量 经 验 ， 开 发 了 多 达 儿 十 种 的 验证 工具 ， 
仍 不 足以 应 付 复杂 的 Power7 验证 工作 。 


恶化 的 “状态 空间 爆炸 ”问题 、 难 以 精确 预测 的 复杂 的 行为 设计 以 及 有 限 的 验证 时 间 和 
资源 使 得 Power7 验证 成 为 IBM 系列 处 理 器 验证 中 难度 最 高 的 芯片 之 一 。IBM 通过 改进 测 
试问 量 生成 技术 、 结 构 检 查 技术 以 及 形式 验证 技术 等 来 缓解 “状态 空间 爆炸 ”问题 ， 应 对 多 
核 多 线程 处 理 器 的 验证 需求 ,然而 多 核 多 线程 异 构 测试 向 量 的 复杂 交互 仍 是 目前 测试 向 量 生 
成 技术 的 难点 所 在 。 为 此 而 采取 的 对 策 有 : 改进 结构 检查 技术 ， 开 发 各 种 点 式 工具 ， 以 便 不 
通过 模拟 仿真 即 可 验证 设计 的 某 些 属性 , 节省 有 限 的 仿真 资源 和 验证 时 间 ; 改进 形式 验证 技 
术 ， 除 传统 的 运算 电路 形式 验证 外 ， 加 大 协议 验证 、 特 别 是 片上 网 络 形式 验证 的 力度 ， 这 就 
同时 简化 了 时 序 电路 等 价 性 检查 流程 ; 采用 一 些 技术 改 进 和 折 中 , 缓解 共享 存储 、 猜 测 执行 、 
低 功 耗 复杂 电源 管理 措施 等 引起 的 结果 预测 检查 的 困难 。 现 代 复杂 处 理 器 设计 中 的 一 些 功 能 
属性 ， 如 错误 修复 机 制 、 功 耗 管理 中 的 处 理 器 部 分 “休眠 状态 ”等 非常 难以 检测 ， 往 往 需 要 
指令 序列 ,花费 数 以 十 万 计 的 时 钟 周期 才能 充分 驱动 相应 的 硬件 机 制 。 因此 ,设计 复杂 的 
指令 序列 非常 重要 。 然 而 ,一 些 多 种 机 制 交 互 的 情况 十 分 难以 覆盖 。 例如， 复杂 电源 管理 
能 和 高 速 缓存 一 致 性 交互 时 出 现 的 一 些 “ 诡 异 ” 的 窗口 问题 或 边 角 情 况 ， 指 望 采用 指令 序 
履 盖 基本 是 不 可 能 完成 的 任务 。 验 证 流程 离 不 开 履 盖 率 度量 ，Power7 验证 中 大 量 运 用 了 
硬件 仿真 加 速 器 ，, 这 对 履 盖 率 采 和 集 分 析 技 术 提 出 了 挑战 : 怎样 才能 在 硬件 仿真 加 速 器 上 完成 
fis in Ee? 怎样 才能 减少 覆盖 率 采 集 对 仿真 加 速 器 性 能 的 影响 ? 长 时 间 采 和 集 的 覆盖 率 数 
据 怎样 存储 和 管理 ? 这 些 问题 都 有 竺 回答。 此 外 ， 除 了 技术 挑战 ， 验 证 项 目 管理 问题 也 已 经 
成 为 Power7 验证 过 程 中 的 难关 。 多 个 地 域 、 多 个 项 目 、 多 个 工作 小 组 的 协调 与 交互 所 需要 
的 高 度 复 杂 的 信息 管理 能 力 已 成 为 制约 验证 效率 的 重要 因素 。 与 Power4、Power5 验证 不 同 ， 
IBM 在 介绍 Power? 验证 工作 时 不 再 将 重点 放 在 工具 开发 和 具体 技术 分 析 上 ， 而 是 更 多 地 介 
绍 了 Power7 验证 工作 中 碰 到 的 一 些 挑 战 和 问题 ,其 中 的 一 些 内 容 甚 至 仅仅 只 是 “问题 ” 在 
文中 根本 找 不 到 答案 。 这 其 实 并 不 奇怪 , 片上 多 核 处 理 器 验证 中 的 许多 问题 目前 仍 是 当前 整 
个 验证 领域 尚未 解决 的 ， 而 “Power7 验证 挑战 ”一 文中 只 是 离散 地 列 出 了 实际 验证 工作 中 
人 泵 到 的 问题 的 一 小 部 分 ， 只 是“ 冰山 一 角 ”。 

£k E. 尽管 涉及 商用 片上 多 核 处 理 器 验证 的 参考 文献 很 少 , 但 对 仅 有 的 儿 篇 参考 文献 进 
行 分 析 , 仍 不 难 在 字里行间 发 现 验 证 工程 师 在 面 对 大 规模 片上 多 核 处 理 器 验证 时 所 面临 的 困 
难 和 无 奈 。 首 先是 流 片 后 的 错误 率 问 题 。 普通 超标 量 处 理 器 验证 时 难得 一 见 的 流 片 后 错误 在 
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S 


8 Dynamic Random Access Memory， 动 态 随机 存 取 存 储 器 
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片上 多 核 处 理 器 验证 综述 


片上 多 核 处 理 器 验证 时 变 得 十 分 常见 , 原因 在 于 片上 多 核 处 理 器 模拟 仿真 速度 极 慢 , 对 于 不 
惜 大 成 本 资源 投入 的 大 的 处 理 器 厂商 来 说 ，IBM 仿真 环境 的 平均 处 理 能 力 所 达 到 的 10 亿 节 
拍 /天 的 水 平 几乎 到 了 成 本 和 能 力 所 能 支 持 的 极限 。 处 理 器 芯片 设计 不 可 能 提供 无 限 的 时 间 
用 来 验证 。 假 设 一 个 芯片 的 验证 周期 是 一 年 ， 则 可 运行 3650 亿 节 拍 仿真 向 量 ， 而 这 仅 相当 
于 实际 芯片 运行 儿 十 分 钟 。 对 于 一 个 商业 蔚 片 产品 来 说 , 不 经 过 2~3 个 月 的 硅 和 后 验证 是 不 敢 
拿 给 用 户 使 用 的 , 从 这 种 巨大 的 落差 可 以 看 出 片上 多 核 处 理 器 验证 面临 流 片 后 的 错误 率 问 题 
并 不 奇怪 。 其 次 是 验证 过 程 和 质量 的 度量 问题 。 履 盖 率 是 指导 验证 过 程 和 衡量 验证 质量 的 重 
要 手段 。 英 特 尔 的 一 篇 文献 曾 描述 了 该 公司 为 验证 一 款 单 核 商业 世 片 所 做 的 功能 覆盖 率 方面 
的 巨大 工作 量 , 共 定 义 了 上 千 万 个 功能 鹤 盖 点 , 花费 了 大 量 的 人 力 物 力 用 于 履 盖 率 的 采集 和 
分 析 ， 最 终 仍 有 大 量 的 功能 覆盖 点 难以 履 盖 且 分 析 困 难 ， 只 好 不 了 了 之 。 不 难 想象 ， 对 于 片 
上 多 核 处 理 器 这 样 规 模 更 大 、 复 杂 度 更 高 、 模 拟 仿真 速度 更 慢 的 芯片 来 说 ， 履 盖 率 工作 必然 
困难 重重 ， 进 而 会 影响 到 整个 验证 过 程 的 收敛 速度 和 质量 。 


前 述 Power4、Power5、Power7 的 验证 只 是 当前 多 核 商 用 处 理 器 验证 的 一 个 缩影 。 可 以 
合理 的 推论 ， 包 括 英 特 尔 、AMD 在 内 的 其 它 处 理 器 厂商 也 同样 会 花费 很 大 的 力量 来 验证 其 
多 核 产品 ， 也 会 面临 相似 的 困难 。 随 着 集成 电路 工艺 的 发 展 ， 片 上 多 核 处 理 器 结构 设计 也 呈 
现 出 越 来 越 复杂 的 趋势 ， 所 包含 的 片上 处 理 器 核 数目 从 2、4、8 一 路 增加 到 64 核 。 片 上 多 
核 处 理 器 验证 尚未 解决 老 的 大 规模 设计 仿真 速度 慢 、 硬 件 加 速 规模 不 足 和 形式 验证 处 理 能 
不 足 的 问题 ， 又 面临 新 的 存储 一 致 性 和 复杂 片上 互联 等 方面 的 验证 困难 。 国 外 大 处 理 器 厂商 
尚且 如 此 ， 面 对 同样 的 问题 ， 国 产 片 上 多 核 处 理 器 验证 就 更 不 容 乐 观 了 。 


4 ”关于 国内 片上 多 核 处 理 器 验证 现状 及 未 来 的 思考 


近年 来 , 国家 出 于 安全 战略 以 及 增强 国际 竞争 力 的 考虑 , 对 国产 处 理 器 研制 工作 非常 支 
持 。 而 对 于 国产 高 性 能 处 理 器 芯片 的 研制 者 ， 片 上 多 核 处 理 器 结构 具有 很 强 的 吸引 力 : 片上 
的 处 理 器 核 可 以 很 简单 ， 使 得 设计 时 间 短 ， 也 易于 获得 较 高 主 频 ， 同 时 与 另 一 种 高 性 能 处 理 
器 结构 一 同时 多 线程 结构 相 比 ， 易 于 克服 线 延 迟 问题 ,具有 明显 的 低 功 耗 优势 ， 可 以 在 国内 
物理 设计 水 平 不 高 的 情况 下 实现 。 这 为 国产 高 性 能 处 理 器 研制 迎 来 了 前 所 未 有 的 机 遇 ， 而 片 
上 多 核 处 理 器 的 研制 也 使 后 发 的 国产 处 理 器 研制 基本 赶 上 了 国外 处 理 器 研制 领域 前 进 的 脚 
步 。 目 前 国内 已 经 有 多 家 单位 从 事 片 上 多 核 处 理 器 结构 的 研究 ， 国 产 的 包含 四 核 、 八 核 、 其 
至 十 六 核 的 片上 多 核 处 理 器 已 经 成 功 流 片 ， 这 些 都 标志 着 国产 处 理 器 研制 工作 的 巨大 进展 。 
然而 ,看 到 了 进展 ， 也 要 看 到 差距 和 问题 。 以 前 的 国产 处 理 器 研究 基本 处 于 追 着 国外 跑 的 状 
态 ， 很 多 实现 方面 的 问题 可 以 找到 借鉴 和 参考 的 对 象 。 在 开展 片上 多 核 处 理 器 研制 时 ， 由 于 
国内 外 差距 的 缩小 , 很 多 实现 中 的 有 具体 问题 已 经 很 难 找到 借鉴 和 参考 的 对 象 ,验证 技术 作为 
处 理 器 设计 中 最 重要 和 繁琐 的 环节 就 首当其冲 碰 到 了 困难 和 瓶颈 ,与 此 同时 , 无 论 从 国家 安 
全 战略 、 还 是 真正 增强 国际 竞争 力 的 目的 出 发 , 国产 高 性 能 处 理 器 研制 的 最 终 目 标 并 不 是 实 
验 室 的 原型 ， 而 是 真正 能 够 使 用 和 推广 的 商业 产品 。 要 实现 这 一 目标 ， 就 绕 不 开 验证 技术 。 


以 本 文 作者 所 在 的 龙芯 团队 为 例 ，, 虽然 经 过 龙芯 工 号 、 龙 世 2 号 7 个 版 本 的 考验 ， 团队 
在 系统 仿真 、 现 场 可 编程 门 阵 列 验 证 、 人 硬件 加 速 仿真 、 指 令 级 随机 验证 、 模 块 级 比较 验证 、 
形式 验证 、 履 盖 率 分 析 、 断 言 检 查 等 技术 领域 积累 了 不 少 经 验 ， 在 应 用 程序 仿真 过 程 中 也 积 
累 了 不 少 测试 用 例 集 ， 同时 还 在 指令 级 随机 验证 、 多 层次 处 理 器 建 模 、 半 形式 化 驱动 履 盖 率 
反馈 、 形 式 验 证 等 领域 提出 和 应 用 了 很 多 新 的 技术 和 方法 , 但 对 于 龙芯 3 号 系列 片上 多 核 处 
理 器 的 验证 复杂 度 来 说 上 述 技术 仍然 不 够 用 。 在 龙芯 3A【〔 四 核 ) 和 龙芯 3B《〈 八 核 ) 片上 多 
核 处 理 器 验证 实践 中 碰 到 了 很 多 新 的 困难 和 挑战 。 举 例 来 说 ， 以 前 的 处 理 器 验证 非常 依赖 的 


zu 10 卷 第 2 期 


全 系统 级 现场 可 编 


信息 技术 快报 


Information Technology Letter 


程 


门 阵列 仿真 在 片 


上 多 核 理 器 验证 时 就 不 再 适用 , 只 能 依靠 新 的 验证 


Vol.10 No.2 
Mar. 2012 


方法 
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者 , 采用 大 投入 解决 验证 问题 不 现实 , 只 有 把 更 多 的 力气 投入 到 
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由 于 现 有 的 验证 技术 无 法 应 对 和 解决 片上 多 核 处 理 器 验证 中 的 困难 和 问题 ,近年 来 , 大 量 的 
研究 围绕 多 核 处 理 器 验证 开展 ， 主 要 包括 以 下 几 个 方面 : 
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